Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Vers une meilleure intégration de la parole dans des systèmes de communication homme-machine

Identifieur interne : 00DD88 ( Main/Exploration ); précédent : 00DD87; suivant : 00DD89

Vers une meilleure intégration de la parole dans des systèmes de communication homme-machine

Auteurs : Jean-Marie Pierrel [France] ; N. Carboness [France] ; Jean-Paul Haton [France] ; K. Smaili [France]

Source :

RBID : ISTEX:0440EA1DD07C68159F02E61744D5ACF7C631B6F2

Descripteurs français

English descriptors

Abstract

Cet article se propose de dresser une synthèse et une classification des diverses applications du dialogue oral homme-machine. Il présente, dans une première partie, les avantages et les limites de la parole comme moyen de communication entre un utilisateur et un système automatisé. Le problème essentiel pour le développement d’interfaces utilisateur à composante orale, à côté du choix d’applications appropriées, est la reconnaissance de la parole, spécialement de la parole continue. Comme les approches diffèrent suivant le type d’applications, nous présentons tout d’abord les problèmes et les techniques spécifiques à l’entrée orale de données et, à titre d’exemple, nous décrivons rapidement l’approche que nous avons adoptée pour la machine à dicter que nous développons dans notre laboratoire. Ensuite nous abordons la compréhension et la gestion de dialogues oraux. Pour illustrer cette présentation, nous présentons l’architecture et les fonctionnalités de divers prototypes que nous avons mis en œuvre : système de messagerie électronique, dialogue pour la commande d’une console sonar et dialogue entre un chirurgien et un système d’aide au diagnostic. Enfin, nous détaillons le gestionnaire de dialogues DIAL, en cours de développement, dont l’objectif est d’aider et de guider un utilisateur dans des activités cognitives complexes telle la recherche de renseignements administratifs.
This paper first surveys and classifies applications of voice humancomputer dialogue. The advantages and limits of speech as a means of communication between users and software are then considered. A major problem in the development of user interfaces with a voice component, besides the choice of appropriate applications, is speech recognition, especially continuous speech recognition. As approaches differ according to the type of application, we first summarize problems and techniques specific to voice data input ; as an example, we briefly describe the speech recognition approach that we have adopted for the dictation machine that we are developing in our Laboratory. Then, the case of voice dialogue understanding and management is considered. To illustrate the discussion, the architecture and functionalities of some prototypes that we have implemented are presented: for instance, an E-mail system and a Sonar control software. Finally, we present a dialogue manager DIAL capable of helping ¡guiding the user in complex cognitive activities that we are currently developing and implementing.

Url:
DOI: 10.3166/ts.7.327-344


Affiliations:


Links toward previous steps (curation, corpus...)


Le document en format XML

<record>
<TEI wicri:istexFullTextTei="biblStruct">
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr">Vers une meilleure intégration de la parole dans des systèmes de communication homme-machine</title>
<author>
<name sortKey="Pierrel, J M" sort="Pierrel, J M" uniqKey="Pierrel J" first="J.-M." last="Pierrel">Jean-Marie Pierrel</name>
<affiliation>
<country>France</country>
<placeName>
<settlement type="city">Nancy</settlement>
<region type="region" nuts="2">Grand Est</region>
<region type="region" nuts="2">Lorraine (région)</region>
</placeName>
<orgName type="laboratoire" n="5">Laboratoire lorrain de recherche en informatique et ses applications</orgName>
<orgName type="university">Université de Lorraine</orgName>
<orgName type="institution">Centre national de la recherche scientifique</orgName>
<orgName type="institution">Institut national de recherche en informatique et en automatique</orgName>
</affiliation>
</author>
<author>
<name sortKey="Carboness, N" sort="Carboness, N" uniqKey="Carboness N" first="N." last="Carboness">N. Carboness</name>
</author>
<author>
<name sortKey="Haton, J P" sort="Haton, J P" uniqKey="Haton J" first="J.-P." last="Haton">Jean-Paul Haton</name>
<affiliation>
<country>France</country>
<placeName>
<settlement type="city">Nancy</settlement>
<region type="region" nuts="2">Grand Est</region>
<region type="region" nuts="2">Lorraine (région)</region>
</placeName>
<orgName type="laboratoire" n="5">Laboratoire lorrain de recherche en informatique et ses applications</orgName>
<orgName type="university">Université de Lorraine</orgName>
<orgName type="institution">Centre national de la recherche scientifique</orgName>
<orgName type="institution">Institut national de recherche en informatique et en automatique</orgName>
</affiliation>
</author>
<author>
<name sortKey="Smaili, K" sort="Smaili, K" uniqKey="Smaili K" first="K." last="Smaili">K. Smaili</name>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:0440EA1DD07C68159F02E61744D5ACF7C631B6F2</idno>
<date when="1990" year="1990">1990</date>
<idno type="doi">10.3166/ts.7.327-344</idno>
<idno type="url">https://api.istex.fr/ark:/67375/HT0-0K86P8RM-1/fulltext.pdf</idno>
<idno type="wicri:Area/Istex/Corpus">000082</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">000082</idno>
<idno type="wicri:Area/Istex/Curation">000082</idno>
<idno type="wicri:Area/Istex/Checkpoint">003194</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Checkpoint">003194</idno>
<idno type="wicri:doubleKey">0765-0019:1990:Pierrel J:vers:une:meilleure</idno>
<idno type="wicri:Area/Main/Merge">00E668</idno>
<idno type="wicri:source">INIST</idno>
<idno type="RBID">Pascal:92-0411387</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000D89</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000B08</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000D67</idno>
<idno type="wicri:explorRef" wicri:stream="PascalFrancis" wicri:step="Checkpoint">000D67</idno>
<idno type="wicri:doubleKey">0765-0019:1990:Pierrel J:vers:une:meilleure</idno>
<idno type="wicri:Area/Main/Merge">00E745</idno>
<idno type="wicri:Area/Main/Curation">00DD88</idno>
<idno type="wicri:Area/Main/Exploration">00DD88</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title level="a" type="main" xml:lang="fr">Vers une meilleure intégration de la parole dans des systèmes de communication homme-machine</title>
<author>
<name sortKey="Pierrel, J M" sort="Pierrel, J M" uniqKey="Pierrel J" first="J.-M." last="Pierrel">Jean-Marie Pierrel</name>
<affiliation wicri:level="0">
<country wicri:rule="zip">France</country>
<country>France</country>
<placeName>
<settlement type="city">Nancy</settlement>
<region type="region" nuts="2">Grand Est</region>
<region type="region" nuts="2">Lorraine (région)</region>
</placeName>
<orgName type="laboratoire" n="5">Laboratoire lorrain de recherche en informatique et ses applications</orgName>
<orgName type="university">Université de Lorraine</orgName>
<orgName type="institution">Centre national de la recherche scientifique</orgName>
<orgName type="institution">Institut national de recherche en informatique et en automatique</orgName>
</affiliation>
</author>
<author>
<name sortKey="Carboness, N" sort="Carboness, N" uniqKey="Carboness N" first="N." last="Carboness">N. Carboness</name>
<affiliation wicri:level="0">
<country wicri:rule="zip">France</country>
</affiliation>
</author>
<author>
<name sortKey="Haton, J P" sort="Haton, J P" uniqKey="Haton J" first="J.-P." last="Haton">Jean-Paul Haton</name>
<affiliation wicri:level="0">
<country wicri:rule="zip">France</country>
<country>France</country>
<placeName>
<settlement type="city">Nancy</settlement>
<region type="region" nuts="2">Grand Est</region>
<region type="region" nuts="2">Lorraine (région)</region>
</placeName>
<orgName type="laboratoire" n="5">Laboratoire lorrain de recherche en informatique et ses applications</orgName>
<orgName type="university">Université de Lorraine</orgName>
<orgName type="institution">Centre national de la recherche scientifique</orgName>
<orgName type="institution">Institut national de recherche en informatique et en automatique</orgName>
</affiliation>
</author>
<author>
<name sortKey="Smaili, K" sort="Smaili, K" uniqKey="Smaili K" first="K." last="Smaili">K. Smaili</name>
<affiliation wicri:level="0">
<country wicri:rule="zip">France</country>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series>
<title level="j" type="main">Traitement du Signal</title>
<title level="j" type="abbrev">Trait. Signal</title>
<idno type="ISSN">0765-0019</idno>
<idno type="eISSN">1958-5608</idno>
<imprint>
<publisher>Lavoisier</publisher>
<date type="published" when="1990-07">1990</date>
<biblScope unit="vol">7</biblScope>
<biblScope unit="issue">4</biblScope>
<biblScope unit="page" from="327">327</biblScope>
<biblScope unit="page" to="344">344</biblScope>
<biblScope unit="page-count">18</biblScope>
<biblScope unit="ref-count">0</biblScope>
<biblScope unit="fig-count">0</biblScope>
<biblScope unit="table-count">0</biblScope>
</imprint>
<idno type="ISSN">0765-0019</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<idno type="ISSN">0765-0019</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>Interface</term>
<term>Language comprehension</term>
<term>Man machine relation</term>
<term>Natural language</term>
<term>Speech recognition</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr">
<term>Compréhension langage</term>
<term>Interface</term>
<term>Langage naturel</term>
<term>Reconnaissance parole</term>
<term>Relation homme machine</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Cet article se propose de dresser une synthèse et une classification des diverses applications du dialogue oral homme-machine. Il présente, dans une première partie, les avantages et les limites de la parole comme moyen de communication entre un utilisateur et un système automatisé. Le problème essentiel pour le développement d’interfaces utilisateur à composante orale, à côté du choix d’applications appropriées, est la reconnaissance de la parole, spécialement de la parole continue. Comme les approches diffèrent suivant le type d’applications, nous présentons tout d’abord les problèmes et les techniques spécifiques à l’entrée orale de données et, à titre d’exemple, nous décrivons rapidement l’approche que nous avons adoptée pour la machine à dicter que nous développons dans notre laboratoire. Ensuite nous abordons la compréhension et la gestion de dialogues oraux. Pour illustrer cette présentation, nous présentons l’architecture et les fonctionnalités de divers prototypes que nous avons mis en œuvre : système de messagerie électronique, dialogue pour la commande d’une console sonar et dialogue entre un chirurgien et un système d’aide au diagnostic. Enfin, nous détaillons le gestionnaire de dialogues DIAL, en cours de développement, dont l’objectif est d’aider et de guider un utilisateur dans des activités cognitives complexes telle la recherche de renseignements administratifs.</div>
<div type="abstract" xml:lang="en">This paper first surveys and classifies applications of voice humancomputer dialogue. The advantages and limits of speech as a means of communication between users and software are then considered. A major problem in the development of user interfaces with a voice component, besides the choice of appropriate applications, is speech recognition, especially continuous speech recognition. As approaches differ according to the type of application, we first summarize problems and techniques specific to voice data input ; as an example, we briefly describe the speech recognition approach that we have adopted for the dictation machine that we are developing in our Laboratory. Then, the case of voice dialogue understanding and management is considered. To illustrate the discussion, the architecture and functionalities of some prototypes that we have implemented are presented: for instance, an E-mail system and a Sonar control software. Finally, we present a dialogue manager DIAL capable of helping ¡guiding the user in complex cognitive activities that we are currently developing and implementing.</div>
</front>
</TEI>
<affiliations>
<list>
<country>
<li>France</li>
</country>
<region>
<li>Grand Est</li>
<li>Lorraine (région)</li>
</region>
<settlement>
<li>Nancy</li>
</settlement>
<orgName>
<li>Centre national de la recherche scientifique</li>
<li>Institut national de recherche en informatique et en automatique</li>
<li>Laboratoire lorrain de recherche en informatique et ses applications</li>
<li>Université de Lorraine</li>
</orgName>
</list>
<tree>
<country name="France">
<region name="Grand Est">
<name sortKey="Pierrel, J M" sort="Pierrel, J M" uniqKey="Pierrel J" first="J.-M." last="Pierrel">Jean-Marie Pierrel</name>
</region>
<name sortKey="Carboness, N" sort="Carboness, N" uniqKey="Carboness N" first="N." last="Carboness">N. Carboness</name>
<name sortKey="Haton, J P" sort="Haton, J P" uniqKey="Haton J" first="J.-P." last="Haton">Jean-Paul Haton</name>
<name sortKey="Smaili, K" sort="Smaili, K" uniqKey="Smaili K" first="K." last="Smaili">K. Smaili</name>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Exploration
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 00DD88 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd -nk 00DD88 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Main
   |étape=   Exploration
   |type=    RBID
   |clé=     ISTEX:0440EA1DD07C68159F02E61744D5ACF7C631B6F2
   |texte=   Vers une meilleure intégration de la parole dans des systèmes de communication homme-machine
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022